مجلهي غدد درنريز متابليسم ايران دانشگاه علم پزشكي خدمات بهداشتي درماني شهيد بهشتي درهي چهاردهم شمارهي صفحههاي ۵۹ ۵۲ (ا بان ۹) از استفاده از رگرسين منطقي براي شناسايي اثرات متقابل برخي پليمرفيسمهاي ژني ساير عامل خطر : بر مطالعهي قند ليپيد تهران سطح پايين ۲ پرين سربخش دكتر يداالله محرابي دكتر مريم االسادات دانشپر فريد زايري مهشيد نامداري دكتر فريدن عزيزي ) گره ا مار زيستي دانشكدهي پيراپزشكي دانشگاه علم پزشكي شهيد بهشتي ۲) گره اپيدميلژي دانشكدهي بهداشت دانشگاه علم پزشكي شهيد بهشتي ) مرکز تحقيقات چاقي پژهشکدهي علم غدد درنريز متابليسم دانشگاه علم پزشكي شهيد بهشتي ) مرکز تحقيقات غدد درنريز متابليسم پژهشکدهي علم غدد درنريز متابليسم دانشگاه علم پزشكي شهيد بهشتي نشاني مکاتبهي نيسندهي مسي ل: تهران لنجك دانشگاه علم پزشكي شهيد بهشتي دانشكدهي بهداشت گره اپيدميلژي e-mail: ymehrabi@gmail.com چكيده مقدمه: رگرسين منطقي يک رش رگرسيني تعميم يافته است که ميتاند اثرات متقابل پيچيده بين متغيرهاي دحالتي را تشخيص دهد. به دليل اهميت تقابلهاي ژنتيكي اين رش در بررسيهاي ژنتيكي با مفقيت استفاده شده است. هدف پژهش حاضر بررسي ارتباط بين كلسترل برخي از پليمرفيسمهاي مرتبط با ا ن با استفاده از رگرسين منطقي است. ماد رشها: دادههاي ۶ نفر (۷۲ مرد ۲۶ زن) كه به طر تصادفي از ميان شرکتکنندگان فاز مطالعهي قند ليپيد تهران با سن ۲۰ سال يا بيشتر انتخاب شده بدند مرد تجزيه تحليل قرار گرفتند. براي تشخيص اثرات اصلي متقابل پليمرفيسمهاي ژني مرتبط با كلسترل از رگرسين منطقي با تابع پيند لجستيك استفاده گرديد. براي جلگيري از شي ب برا رد ضرايب ا نها از الگريتم جستجي برازش شدن مدل از ا زمن اعتبار متقاطع براي يافتن ترکيبهاي منطقي مناسب Simulated Annealing استفاده شد. يافتهها: براساس يافتههاي ا زمن اعتبار متقاطع مدل منطقي با ترکيب بلي پيشبينيکننده بهترين اندازه براي مدل منطقي بد. مدل منطقي برازش داده شده نشان داد افرادي با الل برابري با فاصله اطمينان %۹۵ (۲۵/ ε3 در پليمرفيسم ژن ApoE يا تريگليسريد بالا نسبت به افراد ديگر شانس ۲/۵ /) براي داشتن سطح پايين كلسترل دارند. از سي ديگر داشتن /۵ :%۹۵ تريگليسريد بالا به تنهايي نيز قادر است شانس داشتن كلسترل پايين را ۲/۷ برابر افزايش دهد (فاصله اطمينان.(/۶۵ نتيجهگيري: يافتهها نشان داد براي داشتن كلسترل مقالهي پژهشي پايين بين تريگليسريد بالا پليمرفيسم ژن Apoe اثر متقابل جد دارد. رگرسين منطقي به عنان يک رش جديد قادر به تشخيص چنين اثرات متقابلي است. اژگان كليدي: اثرات متقابل الگريتم Annealing پليمرفيسم تك نكلي تيدي رگرسين منطقي ليپپرتي ين با دانسيتهي بالا مقدمه بررسي عامل ژنتيكي محيطي كه سبب ايجاد بيماريهاي چند عاملي ميشند تعيين مقدار اثر اين مطالعهي قند ليپيد تهران دريافت مقاله: ۹۰//۸ دريافت اصلاحيه: ۹/۲/ پذيرش مقاله: ۹/۲/ عامل از هدفهاي بررسيهاي ژنتيكي بررسيها شناسايي پليمرفيسم تك نكلي تيد اخير است. (SNP i ) در i- Single-nucleotide polymorphism
پرين سربخش همكاران پليمرفيسمهاي ژني در سطح پايين ۵ برا رد اثرات متقابل داراي اهميت فراان ميباشد زيرا فرض بر اين است كه نه تنها اثرات اصلي SNP ها بلكه اثرات متقابل بين ا نها همچنين بين SNP ها عامل محيطي در ايجاد بيماريهاي ژنتيكي انسان دخيل هستند. به همين منظر به تازگي رشهايي براي تشخيص اثرات متقابل ا ماري بين SNP ها معرفي شده كه سبب افزايش تان ا ماري مطالعه گرديده همچنين تفسيرهاي بيلژيكي مفيدي را ارايه ۲ ميدهند. يكي از رشهاي جديد ا ناليز اثرات متقابل رگرسين i منطقي ميباشد كه به عنان يك رش رگرسيني تعميم در سال يافته ۲۰۰ معرفي شده اثرات متقابل مراتب بالاتر در بررسيهاي ميشد. بيشتر براي بررسي ژنتيكي استفاده ii هدف رگرسين منطقي يافتن تركيبات بلي از متغيرهاي دحالتي اليه است بهطري كه اين تركيبات بتانند پيامد مدنظر را به شكل بهتري پيشبيني نمايند. ميتان هر تركيب بلي يافت شده را در قالب يك درخت iii منطقي نمايش داد. متغيرهاي پيشبين كه در درخت يكساني ظاهر ميشند به احتمال زياد براي ايجاد بيماري اثرات برهمكنشي با همديگر دارند. از ا نجا که بررسيهاي پيشين نشان دادهاند بين کاهش سطح ليپپرتي ين با دانسيته بالا () در خن افزايش ميزان برز بيماريهاي قلبي عرقي ارتباط معنيداري جد دارد شناسايي عامل محيطي بيشيميايي ژنتيکي اثر گذار بر ميزان كلسترل ميتاند در پيشگيري از بيماريهاي قلبي عرقي مثر باشد. عامل متعددي مانند جنس زن سن رژيم غذايي تحرك فيزيكي عامل محيطي ۵ ۶ ژنتيكي بر سطح كلسترل تاثير دارند به علاه يکي از عامل مهم تاثيرگذار تغييرات ژنتيکي فرد ميباشد. ژنهاي متعددي کانديداي اين نع بررسيها پليمرفيسم ا پليپپرتي ين ژنهايي مانند ا پليپپرتي ين هستند A1M1 AIV ا پليپپرتي ين B ا پ A1M2 ا پليپپرتي ين ABCA1SRB1 CIII ا پ E با سطح پايين كلسترل خن ارتباط معنيداري را ۷-۹ نشان دادهاند. تعيين نع ارتباط اين پليمرفيسمها كلسترل ميتاند در پيشگيري درمان بيماريهاي قلبي عرقي مثر باشد. ۰ با تجه به شيع بالاي افزايش چربي خن در ايران پژهش حاضر سعي داشت سازكار تاثير SNP ها ري سطح كلسترل خن در جمعيت ايراني را بررسي نمايد زيرا يافتن چنين ارتباطاتي ميتاند در كنترل سطح كلسترل بررسيهاي خن مثر باشد. در جمعيت ايراني متعددي در ارتباط بين پليمرفيسمها ليپيدهاي خني صرت گرفته لي در بيشتر ا نها اين ارتبط به صرت مجزا تكي بررسي شده اثر دسته جمعي تقابلي ا نها بر ليپيد - نگرديده است. اثرات برهمكنشي ممكن بررسي در اين راستا پژهش حاضر تاثير حضر همزمان پلي مرفيسمها بر سطح كلسترل را بعد از تعديل براي متغيرهاي مداخلهگر سن جنس چاقي شكمي تريگليسريد بالا فشار خن بالا گلكز ناشتاي بالا سيگار به سيلهي بررسي نمد. مدل رگرسين لجستيك منطقي ماد رشها ا زمدنيها در بررسي مقطعي حاضر از ميان شرکتکنندگان فاز شدند. مطالعهي مطالعهي iv قند ليپيد تهران انتخاب قند ليپيد تهران يك مطالعهي ا يندهنگر ميباشد كه ري يك نمنه از جمعيت منطقهي در تهران انجام شده هدف ا ن تعيين شيع بيماريهاي غير اگير تريج سبك زندگي سالم در اين جمعيت ميباشد. اين مطالعه مرحله انجام گرديده مرحلهي مطالعهي يك ال که مقطعي بد در طل سالهاي ۷۸-۸۰ انجام گرفت تعداد ۵۰۰۵ نفر از افراد بالاي سال منطقه تهران كه به رش نمنهگيري خشهاي تصادفي انتخاب شده در ا ن بدند شركت نمدند (فاز ). سپس افراد ارد فاز ۲ مطالعه شدند که مطالعهاي ا يندهنگر شامل د قسمت همگرهي مداخلهاي بد ۸ از كه در شرع شد رسيد سپس فاز سم اجرا شد كه از سال ۸۵ پيدا كرد. تعداد ۸ ۶ شركتكنندگان فاز دادههاي بررسي کامل از (۷۲ نفر ۲۶ مرد TLGS ۲۰ با سن SNP SNP هاي مرتبط با زن) به پايان تا ۸۷ ادامه از ميان سال يا بيشتر با ها متغيرهاي ديگر به منظر كلسترل ۵ صرت تصادفي انتخاب مرد بررسي قرار گرفتند. پايين به iv -Tehran lipid and glucose study i- Logic regression ii-boolean cobmination iii- Logic tree
مجلهي غدد درنريز متابليسم درهي چهاردهم, شمارهي ا بان ۹ ۵ ايران مقادير كلسترل کمتر از ۰ ميليگرم در صد ميليليتر براي مردان کمتر از ۵۰ ميليگرم در صد ميليليتر براي زنان به عنان سطح پايين كلسترل تعريف ۶ شد. متغيرهاي مداخلهگر شامل چاقي شكمي (اندازهي در ۹۵ كمر سانتي متر براي مردان زنان ايراني) تريگليسريد ۵۰ ميليگرم در صد ميليليتر فشار خن ۰/۸۵ ميليمتر جيه يا درمان براي فشار خن بالا گلكز ناشتاي پلاسما ۰ ميليگرم در صد ميليليتر يا مصرف داري پايين ا رندهي قند خن براساس تعريف ملفههاي ۷ سندرم متابليك بر اساس معيار ATPШ تعريف گرديد. همچنين افرادي كه در حال حاضر به صرت رزانه يا گهگاه سيگار مصرف ميكنند به عنان سيگاري در نظر گرفته شدند. پليمرفيسمهاي xbal در ژن ا پ Sstl B در ژن ا پليپپرتي ين MspI CIII در ژن ا پليپپرتي ين A1M1 Xagl در ژن پليمرفيسم ژن در ژن SRB1 Alul پليمرفيسم ABCA1 A1M2 ApoE پليمرفيسم ژن ا پليپپرتي ين پليمرفيسم ژن ا پليپپرتي ين كه به AIV احتمال زياد با اختلال در سطح كلسترل مرتبط ۷-۹ هستند بررسي گرديدند. در رش رگرسين منطقي لازم است دادههاي اليه به صرت دحالتي بده متغيرهاي پيشبين جديد به صرت ۸ تركيبهاي بلي از متغيرهاي د حالتي اليه ساخته شند. بنابراين به منظر تجزيه تحليل دادهها هر به SNP صرت متغير تصادفي X با مقادير ۰ ۲ در نظر گرفته شد (به عنان نمنه نکلي تيد GA / AG AA GG به ترتيب با ۰ ۲ كدگذاري شدند). سپس اين متغير به د متغير دحالتي با عنانهاي i ژن غالب ( X D ) ) R ( X تبديل شد. ii مغلب ژن متغير ژن غالب به اين صرت تعريف ميشد: = 1 D X اگر X باشد = 0 D X اگر ۰= X. متغير ژن مغلب نيز به اين صرت تعريف ميشد: = 1 R X اگر X=۲ باشد = 0 R X اگر X باشد. به اين ترتيب تعداد 2p بهدست ميا يد. پيشبينيکنندهي دحالتي از P تا SNP ا مار تصيفي دادهها به صرت ميانگين ±انحراف معيار براي متغيرهاي كمي تعداد (درصد) براي متغيرهاي كيفي گزارش شد. مقايسهي يژگيهاي جمعيتشناختي بيشيميايي بين زنان مردان براي متغيرهاي كمي داراي تزيع نرمال با ا زمن تي براي متغيرهاي غيرنرمال با ا زمن من يتني انجام شد. همچنين براي مقايسهي متغيرهاي كيفي در د گره از ا زمن مجذر خي استفاده گرديد. براي يافتن اثرات متقابل مدلبندي دادهها نيز از رش رگرسين منطقي استفاده شد که در ادامه تضيح داده ميشد. فرض كنيد,X1,,X2 Xk متغيرهاي پيشگي د حالتي y متغير پاسخ است. هدف برازش مدل رگرسيني منطقي به اين فرم است: g(e(y)) = β + 0 t j= 1 βjl j كه در ا ن Lj يك عبارت بلي از متغيرهاي پيشگي Xi بده [( g[e(y يك تابع پپند است. كارايي هر مدل منطقي به سيلهي iii يك تابع امتياز مرتبط با مدل رگرسيني انتخاب شده ارزيابي ميشد كه نشاندهندهي كيفيت مدل مفرض ميباشد. برا رد βj به طر همزمان با جستج براي عبارت Simulated Annealing با استفاده از الگريتم جستجي Lj پيدا ميشد. الگريتم Simulated Annealing يك الگريتم جستجي تصادفي است در فضاي حالتهاي ممکن ترکيبات منطقي بر مبناي تابع بهترين ترکيب ميگردد. جد متغيرهاي ارتباط مستقل سيستماتيك غيرتصادفي امتياز تعيين شده دنبال را ميتان بهسيلهي iv تصادفيسازي مدل صف ر بررسي نمد. بين پاسخ ا زمن اين ا زمن با مقايسه امتيازهاي به دست ا مده از برازش تصادفي پاسخ بهترين مدل منطقي يافت شده به سيلهي الگريتم Annealing جد ارتباط بين متغيرهاي مستقل پاسخ را ارزيابي مينمايد. به منظر انتخاب مدل بهينه جلگيري از بيش برازش شدن مدل از ا زمن v اعتبار متقاطع استفاده گرديد. تعداد کل متغيرهاي مجد در مدل منطقي اندازه مدل ناميده شده به عنان معيار پيچيدگي مدل در نظر گرفته شد. زماني که دنبال بهترين مدل از لحاظ امتياز ميگرديم ممکن است به مدلي برسيم که تعداد متغيرهاي بيشتري از ا نچه مدل بهينه دارد. ميتان با مقايسهي عملکرد بهترين مدلها در ابعاد iii- Score function iv- Null model randomization test v- Cross-validation test i- dominant ii- recessive
پرين سربخش همكاران پليمرفيسمهاي ژني در سطح پايين ۵۵ مختلف مدل با اندازهي بهينه را انتخاب نمد. زماني كه داده به اندازهي كافي مجد باشد ميتان از رش مجمعهي ا مزش i -ا زمن استفاده نمد. زماني كه دادهي كافي براي يك مجمعهي مستقل ا زمن جد ندارد ميتان با تقسيم كردن دادهها به m گره مساي از رش اعتبار متقاطع براي پيدا كردن مدل با اندازهي بهينه استفاده نمد. براي تعيين ارتباط بين تركيباتي شامل اثرات اصلي متقابل SNPها با سطح پايين كلسترل در حضر متغيرهاي مداخلهگر از رگرسين لجستيك منطقي ) Logic E( y) g[e(y)] = log 1 E( y) (Logistic Regression با تابع پيند = π 2 d( D استفاده y i, ˆ i) تابع امتياز "ا مارهي انحراف " شد. ا زمن تصادفيسازي براي بررسي جد ارتباط بين متغيرهاي پيش بين پاسخ انجام شد. براي جلگيري از بيش برازش شدن مدل انتخاب بهينهترين مجمعه از SNPها براي پيشبيني بهتر متغير پاسخ از رش متقاطع استفاده شاخصه يا اعتبار مدل با به کارگيري الگريتم Annealing برا رد گرديد. همچنين به منظر برازش مدل رگرسين منطقي از نرمافزار R نسخهي ۲,,۰ برنامهي Logic Reg استفاده شد. در پژهش حاضر از ميان يافتهها ۶ نفر ) ۷۲ مرد ۲۶ زن) مرد بررسي ۲۹ نفر (۶۷/۲ %) داراي كلسترل پايين بدند. يژگيهاي جمعيتي شاخصهاي خني اين افراد به تفكيك جنس در جدل ارايه شده است. فرااني ا للها ژنتيپها در جدل ۲ نشان ميدهد تزيع ژنتيپها از تعادل هاردي اينبرگ تبعيت نمده است. ا زمن تصادفيسازي مدل صفر فقط به منظر بررسي تاييد جد ارتباط سيستماتيك بين متغيرهاي پيشبين پاسخ به كار ميرد تا در صرت تاييد جد چنين ارتباط سيستماتيك غير تصادفي بين دادهها به دنبال يافتن مدل منطقي مناسب دادهها تسط الگريتم جستجي Annealing باشيم. اين ا زمن با برازش مدلهايي بر مبناي دادههايي كه ترتيب ا نها به طر تصادفي بهم خرده مدلهاي تصادفي را برازش ميدهد هيستگرام مربط به امتيازات اين مدلهاي تصادفي را رسم مينمايد سپس بر مبناي دادههاي با ترتيب اقعي نيز بهترين مدل منطقي را برازش ميدهد امتياز ا ن را به عنان امتياز بهترين مدل رسم ميكند. * جدل - يژگيهاي پايهي افراد حاضر در پژهش متغير زنان مردان كل P (۶) (تعداد= ( ۲۶ (تعداد= (۷۲ ۰/۵ ۵/۷±۵/ ۷ ۷/۰۹±۶/ /۸±۵/ سن (سال) ۲ ii نمايهي تده بدن (كيلگرم بر مترمربع) < ۰ / ۰۰ ۲۷/±/ ۶ ۲۶/۰±/ ۶۶ ۲۸/۲±۵/ ۹ < ۰ / ۰۰ /۶±۹/ ۸ ۷/±۷/ سطح ۹ /۵۵±۹/ ۹۸ ۰ /۵۸ ۸ (۲۷/) ۹ (۲۸/۵) فشار خن بالا (۲۶/) ۶۹ ۰ /۰۰ ۸۷ (۲/۹) ۹۰ (۵۲/) در كمر بالا (۶/۷) ۹۷ ۰ /۲ ۷ (۹/۹) ۷۵ (/۶) تريگليسريد بالا (۷/۵)۹۹ ۰ /۵۹ ۵۰ (/۵) ۸ (۰/۵) قنذ خن ناشتا بالا (۲/)۲ < ۰ / ۰۰ ۹ (۸/۹) ۵ (۲۰/) (/۵) سيگاري *دادهها به صرت تعداد (درصد) براي دادههاي كيفي انحراف معيار ± ميانگين براي دادههاي كمي گزارش شدهاند. مقدار ۰/۰۵>P از نظر ا ماري معنيدار است. از سي ديگر امتياز مربط به مدلي كه در ا ن هيچ متغير پيشبيني جد ندارد را نيز تحت عنان امتياز مدل صفر رسم مينمايد. با مقايسهي امتيازات اين سه گره مدل پيرامن قدرت پيشبينيكنندگي متغيرهاي پاسخ ميتان اظهارنظر نمد زيرا اگر امتياز هيستگرام مدلهاي تصادفي با بهترين مدل اختلاف داشته باشد ميتان گفت امتياز مدلي با ترتيب اقعي دادهها با متغيرهاي پيشبين استفاده شده از هيستگرام امتياز مدلهاي تصادفي بهتر است متغيرهاي مجد در مدل اقعي يا بهترين مدل داراي پيشبينيكننده براي متغير پاسخ هستند. اثر يافتههاي ا زمن تصادفي سازي مدل صفر براي بررسي جد ارتباط بين متغيرهاي مستقل متغير پاسخ (كلسترل پايين) كه در شكل نشان داده شده نشان ميدهد بعد از برازش صد مدلي كه در ا نها ترتيب داده ها به طر تصادفي باهم جابجا شده بدند هيستگرام مربط به امتيازات اين مدلهاي تصادفي بيشتر (بدتر) از مدل برازش يافته با پاسخهاي اقعي بد بيانگر اين است كه بين متغيرهاي پيشبين مرد بررسي سطح پايين كلسترل ارتباط سيستماتيك غيرتصادفي جد دارد از اين متغيرها ميتان براي مدلبندي سطح پايين كلسترل استفاده نمد. ii -Body mass index i- Training and test set
مجلهي غدد درنريز متابليسم درهي چهاردهم, شمارهي ا بان ۹ ۵۶ ايران جدل ۲- فرااني اللها ژنتيپهاي افراد * مرد بررسي فرااني اللها (%) تعداد ApoE e2 (۰/) e3 (۷۸/۷) e4 ۹(/۲) فرااني ژنتيپها تعداد (%) ApolipoproteinAIV_SNP_FnuHI ApolipoproteinCIII_SNP_SstI ABCA1_SNP_XagI SRB1_SNP_AluI TT (۰/۲) CC ۰(۶۹/۵) GG ۵۵(۵/۶) GG ۶۰(۸۲/۶) ApolipoproteinA1M1_SNP +/+ (۷۲) ApolipoproteinA1M2_SNP +/+ ۹۶(۹۰/۸) ApolipoproteinB_SNP_XbaI +/+ (۹/) GG ۶۵(۸/۷) GG (/۲) AA ۵۹(/۵) AA (۰/۹) -/- ۷(/۶) -/- ۶(/) -/- ۲۲(۵/) GT ۷۰(۶/) CG ۹(۲۷/) GA ۲۲۲(۵۰/۹) GA ۷۲(۶/۵) +/- ۵(۲۶/) +/- (۷/۸) +/- ۷۲(۹/) *دادهها به صرت تعداد (درصد) گزارش شدهاند. ۷ ۶ ۵ ۲ ۰ ۵۰۰ ۵۰ ۵۲۰ ۵۰ ۵۰ ۵۵۰ مدل صفر بهترين مدل امتياز شکل - ا زمن تصادفی سازي مدل صفر به منظر بررسي جد ارتباط بين پاسخ متغيرهاي مستقل تعداد ۵۵ ۵ ۵ ۲۵ ۶ ۸ ۰ ۲ ا مارههاي انحراف مربط به مدلهايي با تعداد درختها برگهاي متفات در گره ا مزش ۶۲ ۶۰ ۵۸ ۵۶ ۵ ا مارهي انحراف گره ا مزش ا مارهي انحراف گره ا زمن يافتههاي ا زمن اعتبار متقاطع نيز در شكل ۲ نشان داده شده است كه در اين شكل اعداد داخل مربعهاي سياه نشانگر تعداد درختها (تركيبات منطقي) اعداد ري محر افقي نشانگر تعداد برگهاي (متغيرهاي د حالتي) مشمل در مدل است. ۶ ۸ ۰ ۲ ا مارههاي انحراف مربط به مدلهايي با تعداد درختها برگهاي متفات در گره ا زمن شكل - ۲ ا زمن اعتبارمتقاطع. اعداد داخل مربعهاي سياه نشانگر تعداد درختها ) تركيبات منطقي) اعداد ري محر افقي نشانگرتعداد برگهاي (متغيرهاي د حالتي) مشمل در مدل است. اعداد ري محر عمدي نيز نشانگر مقدار امتياز براي مدلهاي مختلف ميباشد. شكل مربط به گره ا مزش
پرين سربخش همكاران پليمرفيسمهاي ژني در سطح پايين ۵۷ نشان ميدهد كه در گره ا مزش هر چه اندازهي مدل از نظر تعداد تركيبات منطقي متغيرهاي مشمل در اين تركيبات بيشتر ميشد امتياز مدلها كمتر شده برازش بهتر ميشد كه اين امر حاكي از امكان بيشبرازش شدن مدل است. مشاهدهي امتيازات گره ا زمن نيز بيشبرازش شدن مدلهاي گره ا مزش امتيازات نشانگر اين ميباشد اندازههاي مختلف مدلي با را تاييد مينمايد زيرا اين كه از بين تمام مدل ها با تركيب منطقي متشكل از متغير كمترين امتياز را نسبت به بقيه دارد. در نتيجه انتخاب مدل منطقي با اين اندازه مناسب دادهها بده اين مدل بهترين برازش را براي متغير پاسخ دارد. براساس اين شكل مشاهده ميشد افزايش اندازهي مدل در نظر گرفتن تعداد زياد متغيرهاي پيشبين سبب بهبد مدل نشده فقط سبب بيشبرازش شدن ا ن ميگردد بهينهترين اندازه براي مدل مربط به اين دادهها مدلي با تركيب متشكل از متغير پيشبين است كه كمترين ا مارهي انحراف را در گره ا زمن دارد. بعد از انتخاب اندازهي تركيب (مدل با مناسب مدل منطقي متغير) يافتههاي جستجي الگريتم Annealing براي يافتن مدل رگرسين لجستيك منطقي مناسب براي بيان ارتباط بين SNP ها عامل محيطي شامل: سن جنس تريگليسريد بالا فشار خن بالا قند خن بالا اندازهي در كمر بالا سيگار با سطح پايين كلسترل به صرت زير بهدست ا مد: Logit پايين) /۶+۰/ =(كلسترل ۸۵۷(ApoE= (زن=جنس ( + ۰/ TG) بالا) ۰ TG)+ / بالا يا ε3 TG) براساس مدل ياد شده افرادي كه داراي تركيب منطقي بالا يا (ApoE= ε3 مربط به ژنApoE هستند ا نها به صرت يعني الل پليمرفيسم است يا ε3 تريگليسريد بالايي دارند نسبت به افراد ديگر شانس ۲/۵ برابري با فاصله اطمينان /۲۵) %۹۵ سطح پايين كلسترل دارند. /) براي داشتن همچنين داشتن تريگليسريد بالا به تنهايي نيز قادر است شانس ابتلا به كلسترل پايين داشتن را ۲/۷ برابر افزايش دهد [فاصلهي اطمينان %۹۵: (۵/ /۶۵)]. جنسيت نيز به عنان يكي از عامل تاثيرگذار بر كلسترل پايين در اين مدل ظاهر شد به طري كه زنان نسبت به مردان داراي شانس بدند. / برابري براي داشتن كلسترل تاثير اين متغير با فاصله اطمينان ۲/۷) : %۹۵ ۰/۹) بر كلسترل پايين معنيدار نبد. پايين براساس مدل به دست ا مده مقدار امتياز اين مدل كه همان ا مارهي انحراف مدل لجستيك است ۵۰/۶۶ به دست ا مد. بحث يافتههاي پژهش حاضر بيانگر ارتباط يك پلي مرفيسم از مجمعهي پليمرفيسمهاي انتخابي با سطح پايين كلسترل است به طريكه حضر الل ε3 ژن ا پليپپرتي ين Ε منجر به کاهش ميزان كلسترل شده در نتيجهي ا ن خطر برز بيماريهاي قلبي عرقي افزايش مييابد. بررسي حاضر جد يك اثر متقابل بين اين ژن تريگليسريد بالا را نشان ميدهد به طري كه براساس تركيب منطقي " يا" به دست ا مده حضر الل ε3 يا داشتن تريگليسريد بالا يا حضر همزمان هر د بر داشتن سطح پايين كلسترل تاثير معنيدار دارد در حاليكه در پژهشهاي قبلي چنين تقابلهايي تشخيص داده نشده اثر اين پليمرفيسم بر سطح كلسترل به صرت ۵ ۸ ۹ اثرات اصلي ارزيابي شده است. تفات در يافتههاي بررسيهاي مختلف نيز ميتاند ناشي از تفات مدلهاي استفاده شده تكنيك تحليل دادها باشد زيرا كه رشهاي استفاده شده در بررسيهاي پيشين كمتر به مسالهي اثرات i متقابل اهميت ا ن پرداختهاند بيشتر تحليل تك متغيري در مرد اثرات اصلي متغيرها انجام گرفته است. استفاده از رشهاي رگرسيني براي تحليل همزمان متغيرها در كنار هم بهيژه با امكان در نظر گرفتن برهمكنشي بين متغيرها ميتاند منجر به يافتههاي دقيقتري گردد. همچنين متغير تريگليسريد بالا به عنان متغير مهم تاثير گذار بر سطح كلسترل ظاهر شد كه با نسبت شانس بالايي ميزان كلسترل خن را تحث تاثير قرار ميدهد. اين متغير علاه بر اينكه در حضر الل ε3 متغير پاسخ را تحت تاثير قرار ميدهد به تنهايي نيز اثر قابل تجهي بر پاسخ دارد لازم است پيشگيري يا درمان تريگليسريد بالا براي پيشگيري از سطح پايين كلسترل مرد تجه قرار گيرد. i- Analysis
مجلهي غدد درنريز متابليسم درهي چهاردهم, شمارهي ا بان ۹ ۵۸ ايران از سي ديگر متغير جنس به عنان عاملي مثر بر ميزان كلسترل در مدل ظاهر شده اما اثر متقابلي با ساير متغيرها ندارد. اگرچه اثر اين متغير از نظر ا ماري معنيدار نيست لي نشان ميدهد در بررسي عامل مثر بر سطح كلسترل بايد اثر عامل مخدشگر نيز در نظر گرفته شد. يكي از هدفهاي بررسيهاي ژنتيكي تشخيص اثرات اصلي متقابل پليمرفيسمها بر برز بيماريها ميباشد. از ا نجا كه گاهي اثرات تقابلي برهمكنشي بين پليمرفيسمها تاثيرگذارتر از اثرات انفرادي ا نها ميباشد نياز به رشهايي است كه قادر به يافتن چنين اثرات متقابلي باشد. همچنين رش استفاده شده بايد قادر به تعيين شدت اثر اين تقابلها نيز باشد. يكي از رشهايي كه به تازگي معرفي شده در بررسيهاي ژنتيكي كاربرد فراان يافته رش رگرسين منطقي ميباشد. اين رش رگرسيني براي يافتن اثرات متقابل بين پليمرفيسمها ساير عامل خطر كه به طر معمل با رشهاي مرسم قادر به يافتن ا نها نيستيم استفاده ميشد. برتري رگرسين منطقي نسبت به ساير رشهاي تجزيه تحليل متغيرهاي دحالتي مانند رش شبكههاي عصبي مصنعي درخت تصميمگيري اين است که يافتههاي رگرسين منطقي به طر كامل به شکل يک مدل رگرسين نشته ميشد در نتيجه امكان تفسير ضرايب انجام ا زمن فرضيه در مرد ضرايب همچنين ارزيابي كفايت مدل با استفاده از تابع امتياز ا ن مدل جد ۲۰ دارد. اين رش رگرسيني به تازگي در بررسيهاي متعددي براي تحليل دادهها استفاده گرديده از جمله در ايران محرابي همكاران در پژهشي مدل رگرسين منطقي را به ۲۰ منظر پيشبيني برز ديابت ارايه دادهاند. همچنين در پژهشي كه براي بررسي ارتباط پليمرفيسمها با برز سرطان پستان انجام شده پليمرفيسمهاي مرتبط با اين سرطان برهمكنش بين ا نها با رش رگرسين منطقي ۲ شناسايي گرديده است. در بررسي ديگري اثر برخي پليمرفيسمها بر سطح كلسترل LDL خن بررسي شده كه در اين پژهش نيز اثرات متقابل بين اين پليمرفيسمها با ۲۲ رگرسين منطقي شناسايي شدهاند. در بررسيهاي ژني به دليل اهميت اثرات متقابل بر برز بيماريها شناسايي اين اثرات متقابل داراي اهميت ميباشد. رگرسين منطقي رش مناسبي به منظر شناسايي تعيين شدت اثر چنين اثرات متقابلي است. در بررسي حاضر نيز با استفاده از رگرسين منطقي اثرات متقابل مثر بين پليمرفيسمها بر سطح كلسترل با حضر عامل مداخلهگر بررسي گرديد. هلهي از محدديتهاي پژهش ميتان بيان نمد كه ال تعداد پليمرفيسمهاي قابل اندازهگيري در در مقايسه با پليمرفيسمهاي درگير با كلسترل كم بد نيز محدديت بعدي در رابطه با جمعا ري ساير متغيرهاي مثر بر سطح كلسترل بد. سپاسگزاري: در پژهش حاضر از دادههاي طرح قند ليپيد تهران که تسط پژهشکدهي علم غدد درنريز متابليسم دانشگاه علم پزشکي شهيد بهشتي اجرا شده استفاده گرديد. پژهشگران از تمام کساني که در طراحي جمعا ري دادههاي TLGS مشارکت داشتند نهايت قدرداني را به عمل ميا رد. اين مقاله برگرفته از پاياننامهي خانم پرين سربخش (دانشجي دكتري ا مار زيستي) است كه در ضمن طرح مصب پژهشكده نيز ميباشد. References 1. Lucek PR, Ott J. Neural network analysis of complex traits. Genet Epidemiol 1997; 14: 1101-6. 2. Vermeulen SH, Den Heijer M, Sham P, Knight J. Application of multi-locus analytical methods to identify interacting loci in case-control studies. Ann Hum Genet 2007; 71: 689-700. 3. Ruczinski I, Kooperberg C, LeBlanc M. Logic Regression. Journal of Computational and Graphical Statistics 2003; 12: 475-511. 4. Goldbourt U, Yaari S, Medalie JH. Isolated Low cholesterol as a risk factor for coronary heart disease mortality: a 21-year follow-up of 8000 men. Arterioscler Thromb Vasc Biol 1997; 17: 107-13. 5. Kim SM, Han JH, Park HS. Prevalence of low cholesterol levels and associated factors among Koreans. Circ J 2006; 70: 820-6. 6. Dwyer T, Calvert GD, Baghurst KI, Leitch DR. Diet, other lifestyle factors and cholesterol in a population of Australian male service recruits. Am J Epidemiol 1981; 114: 683-96. 7. Brown CM, Rea TJ, Hamon SC, Hixson JE, Boerwinkle E, Clark AG, et al. The contribution of individual and pairwise combinations of SNPs in the APOA1 and APOC3 genes to interindividual -C variability. J Mol Med (Berl) 2006; 84: 561-72. 8. McCarthy JJ, Lehner T, Reeves C, Moliterno DJ, Newby LK, Rogers WJ, et al. Association of genetic variants in the receptor, SR-B1, with abnormal lipids in women with coronary artery disease. J Med Genet 2003; 40: 453-8.
پرين سربخش همكاران پليمرفيسمهاي ژني در سطح پايين ۵۹ 9. Frikke-Schmidt R. Context-dependent and invariant associations between APOE genotype and levels of lipoproteins and risk of ischemic heart disease: a review. Scand J Clin Lab Invest Suppl 2000; 233: 3-25. 10. Azizi F, Salehi P, Etemadi A, Zahedi-Asl S. Prevalence of metabolic syndrome in an urban population: Tehran Lipid and Glucose Study. Diabetes Res Clin Pract 2003; 61: 29-37. 11. Daneshpour MS, Faam B, Hedayati M, Eshraghi P, Azizi F. ApoB (XbaI) polymorphism and lipid variation in Teharnian population. European Journal of Lipid Science and Technology 113: 436-40. 12. Daneshpour MS, Hedayati M, Azizi M. Hepatic Lipase C-514T polymorphism and its association with -C level in Tehran. Kowsar Medical Journal 2005; 10: 135-42.[Farsi] 13. Daneshpour MS, Hedayati M, Azari F, Ghasemi F, Azizi F. Association between the cholesteryl ester transfer protein_taqi polymorphism and low -C concentration in Tehran population. Iranian Journal of Endocrinology and Metabolism 2004; Suppl 5: 355-61. [Farsi] 14. Azizi F, Rahmani M, Emami H, Mirmiran P, Hajipour R, Madjid M, et al. Cardiovascular risk factors in an Iranian urban population: Tehran Lipid and Glucose Study (Phase 1). Soz Präventivmed 2002; 47: 408-26. 15. Daneshpour MS, Hedayati M, Eshraghi P, Azizi F. Association of Apo E gene polymorphism with level in Tehranian population. European Journal of Lipid Science and Technology 112: 810-6. 16. Expert Panel on Detection, Evaluation, and Treatment of High Blood Cholesterol in Adults. Executive Summary of The Third Report of The National Cholesterol Education Program (NCEP) Expert Panel on Detection, Evaluation, And Treatment of High Blood Cholesterol In Adults (Adult Treatment Panel III). JAMA 2001; 285: 2486-97. 17. National Cholesterol Education Program (NCEP) Expert Panel on Detection, Evaluation, and Treatment of High Blood Cholesterol in Adults (Adult Treatment Panel III).Third Report of the National Cholesterol Education Program (NCEP) Expert Panel on Detection, Evaluation, and Treatment of High Blood Cholesterol in Adults (Adult Treatment Panel III) final report. Circulation 2002; 106: 3141-421. 18. Zaman MM, Ikemoto S, Yoshiike N, Date C, Yokoyama T, Tanaka H. Association of apolipoprotein genetic polymorphisms with plasma cholesterol in a Japanese rural population: The Shibata Study. Arterioscler Thromb Vasc Biol 1997; 17: 3495-504. 19. Saidi S, Slamia LB, Ammou SB, Mahjoub T, Almawi WY. Association of apolipoprotein E gene polymerphism with ischemic stroke involving large-vessel disease and its relation to serum lipid levels. J Stroke Cerebrovasc Dis 2007; 16: 160-6. 20. Mehrabi Y, Sarbakhsh P, Khadem-Maboudi A, Hadaegh F. Prediction of Diabetes Using Logic Regression. Iranian Journal of Endocrinology and Metabolism 2010; 12: 16-24. [Farsi] 21. Schwender H, Ickstadt K. Identification of SNP interactions using logic regression. Biostatistics 2008; 9: 187-98. 22. Voora D, Reed CR, Zhai J, Salisbury BA, Shah SH, Ginsburg GS. Polymorphisms in ABCA1 predict statin mediated LDL cholesterol lowering and suggest an interaction with CETP. Circulation 2007; 116: II-178.
Vol 14 No.4 November 2012 Iranian Journal of Endocrinology and Metabolism / 416 Original Article Logic Regression Analysis for Finding Interaction Effects of Genes Polymorphisms and Other Risk Factors on Low : Tehran Lipid and Glucose Study Sarbakhsh P 1, Mehrabi Y 2, Daneshpour M 3, Zayeri F 1, Namdari M 1, Azizi F 4 1 Department of Biostatistics, Faculty of Paramedicine, & 2 Department of Epidemiology, Faculty of Public Health, & 3 Obesity Research Center, & 4 Endocrine Research Center, Research Institute for Endocrine Sciences, Shahid Beheshti University of Medical Sciences,Tehran, I.R. Iran e-mail: ymehrabi@gmail.com Received: 07/02/2012 Accepted: 02/05/2012 Abstract Introduction: Logic regression is a generalized regression method that can identify complex Boolean interactions of binary variables. This method has been successfully used for analyzing single-nucleotide polymorphism data, because in SNP association studies interactions are important. The aim of this study is to investigate the associations between some candidate gene polymorphisms and concentration using Logic Regression. Materials and Methods: Subjects for this cross sectional study, 436 subjects (172 men and 264 women) aged 20 with some polymorphisms, were randomly selected from among participants of the Tehran Lipid and Glucose Study (TLGS). Logic regression analysis was used to identify combinations of main genetic effects and interactions associated with. Cross validation and randomization test were done to avoid over fitting of the models. Results: Cross validation test suggested that the Logic model with four Boolean combinations and four predictors was the best logic model, which after fitting, showed that individuals who carry Apoe SNP ε3 or have high TG have an odds ratio of 2.35 ( CI 95%:1.3-4.25) for having low compared to other subjects. Also subjects with high TG have odds ratio 2.73 (CI 95%: 1.65,4.53) for having low. Conclusion: Results of this study shows that Logic Regression is a powerful method to determine the interaction effect between high TG and ApoE SNP for having low. Keywords: Interaction, Annealing algorithm, SNP, Logic regression, low, TLGS